#Exerccio 4 - Anlises Exploratrias 
#Camila Galheigo Coelho

setwd("C:/Users/Camila/Documents/PESQUISA/1_DOUTORADO/Disciplinas/R")
getwd()


# Cervejas #

cervejas <-c("chope","lata","garrafa","chope","garrafa", "garrafa","lata","lata","nenhuma","lata","garrafa","garrafa", "garrafa","lata","lata","lata","garrafa","lata","chope","nenhuma", "garrafa","garrafa","garrafa","chope","garrafa","garrafa","chope","garrafa","lata","lata")
cervejas
#Q1:
barplot(table(cervejas))
dotchart(as.matrix(table(cervejas)))

#Q2: o dotchart tem a maior razo dados/tinta e portanto  prefervel.


# Rios #

data(rivers)
rivers
#Q1 - Qual a proporo do total de rios que tem extenso menor do que a mdia?
summary(rivers)

rivers.menor.media<-rivers[rivers<mean(rivers)]
rivers.menor.media
prop<-length(rivers.menor.media)/length(rivers)
prop    #[1] 0.6666667
   
#Q2: Qual  o quantil de 75%?  o 3o quartil, o qual pode ser obtido pela funo summary:
summary(rivers)    #3rd Qu. 680,0

#Q3: Compare a mdia, mdia truncada a 25% e mediana. H diferenas?
mean(rivers)              #[1] 591.1844
mean(rivers, trim=0.25)   #[1] 449.9155
median(rivers)            #[1] 425
# Sim, a mdia truncada est mais prxima da mediana o que indica que h valores extremos que esto deslocando positivamente a mdia. 


# Caixetais #

cax = read.csv("caixeta.csv", header=TRUE, as.is=TRUE)

#Q1: Construa um histograma da altura dos fustes do caixetal.
par(mfrow=c(2,2))
head(cax)
tail(cax)
hist(cax$h)

#Q2: Construa histogramas da altura das rvores para os diferentes caixetais ('local').
hist(cax$h[cax$local=="chauas"])
hist(cax$h[cax$local=="retiro"])
hist(cax$h[cax$local=="jureia"])
#Q3: H diferenas entre as estruturas (distribuio de tamanhos) dos caixetais?
 # difci saber pois esto em porpores diferentes devido a um valor extremo encontrado em Chauas.
 #J entre Retiro e Jureia parece haver uma diferena na distribuio das alturas das rvores, sendo que em Retiro vmos o que se assemlha a uma bimodal. 

# Eucaliptos #

E.grandis = read.csv("egrandis.csv", header=TRUE, sep=";")
head(E.grandis)
tail(E.grandis)

#Q1:
boxplot(E.grandis$dap~E.grandis$regiao)   
boxplot(E.grandis$dap~E.grandis$rotacao)

#Q2:
qqnorm(E.grandis$ht)
qqline(E.grandis$ht)   #de acordo com o grfico quantil-quantil a distribuio de altura no se aproxima de uma distribuio normal.


# Mais Caixetais #

#Q1: Analise a relao dap-altura ('dap' e 'h') em funo do caixetal, mas somente para os fustes de caixeta (Tabebuia cassinoides).
plot(cax$cap[cax$especie=="Tabebuia cassinoides"]~cax$h[cax$especie=="Tabebuia cassinoides"])

#Q2: Para a mesma relao do item anterior, verifique linearidade com a funo scatter.smooth
scatter.smooth(cax$cap[cax$especie=="Tabebuia cassinoides"]~cax$h[cax$especie=="Tabebuia cassinoides"])

#Q3: Utilizando o pacote lattice, analise a relao dap-altura ('dap' e 'h') em funo do caixetal, mas somente para os fustes de caixeta (Tabebuia cassinoides).
library(lattice)
xyplot(cap[cax$especie=="Tabebuia cassinoides"]~h[cax$especie=="Tabebuia cassinoides"] | cax$local)

save.image()
 